金融时间序列有几个普遍现象:
一组时间序列本身可能只有非常微弱的相关性,而它的函数(平方项、绝对值)呈现很强的相关性
资产收益率序列的条件方差会随着时间改变,呈现条件异方差的特征
波动集聚(volatility clustering)现象,资产收益率序列的波动会有持续的现象,大波动跟着大波动,小波动跟着小波动
资产收益率序列并不服从正态分布,其极端值较多,具有厚尾(heavy tail)现象
ARCH和GARCH模型就是用来对收益率序列的波动建模预测的,首先我们要弄清楚怎么样衡量波动率。
ARCH
一般先假设收益率序列$\{y_t\}$满足某个方程式,比如AR(p)、MA(q)、ARMA(p,q),这里用简单的AR(1)说明ARCH模型。
那么$y_{t+1}$的条件方差为:
这启发我们,要预测收益率$y_{t+1}$的方差(波动率)的问题,转化为预测$E_t(\epsilon_{t+1})^2$的问题。
一个简单的解决办法将残差估计值的平方建模为AR(q)模型:
其中$v_t$是白噪音过程,而$\epsilon_t$可以来自一个自回归、ARMA、或标准常见的回归模型,所以ARCH有很多用途。
实际上将干扰项$v_t$表示为乘法干扰项更容易处理,这就是我们所说的ARCH(1)模型:
其中$v_t$为白噪音过程,$v_t \sim IID(0,1)$,$v_t$和$\epsilon_{t-1}$相互独立。这样设定的优点在于收益率序列的自回归模型里面,$\epsilon_t$仍然是白噪声过程(均值为0,方差恒定,所有自协方差为0),但ARCH(1)的影响全部体现在了条件方差上,这样我们能够利用最近几期的信息去预测下一期的收益率的波动率(方差)。
验证$\epsilon_t$为白噪声过程:
(1) 由$v_t$和$\epsilon_{t-1}$相互独立及$E(v_t)=0$,得
(2) 由无条件方差$E(\epsilon_t^2)=E(\epsilon_{t-1}^2)$,得
整理得$\epsilon_t$的(恒定)方差为
(3) 由$v_t$属于白噪声,所以自协方差满足
至此知道了$\epsilon_t$保留白噪声的优良性质,下面可以验证代表$y_t$的条件方差$\epsilon_t^2$可以用自回归模型来预测:
记住,ARCH模型是完全单纯的统计模型,他们只是捕捉到金融序列的特征,而不能用来解释金融序列为何有这些特征。
ARCH(q)模型的估计过程:
(1)设定阶数$p$,为确定ARCH(q)模型中的阶数,在检验得知时间序列$\{\epsilon_t\}$确实存在显著的ARCH效应后,我们可以用$\epsilon_t^2$的偏自相关函数(PACF)来确定$p$
(2)确定模型阶数$p$后,常常假设干扰项$v_t$服从某一分布(标准正态分布、标准化的t分布、广义误差分布),然后使用极大似然法估计。
(3)在参数估计后,需要检验模型设定。最常见的检验依赖于以下事实:一个正确设定的ARCH模型,标准化残差
是独立同分布的随机过程,因此$\hat{v_t}$和$\hat{v}_t^2$的Ljung-Box统计量可以分别用来检验均值方程和波动率方程的正确性。
GARCH
Bollerslev(1996)扩展了Engle的原始模型,引入了允许条件方差转化为ARMA过程的方法。现在假设误差过程为:
这个模型就是GARCH(p,q),p个自回归项,q个误差项,实际意义上认为收益率序列每个时间点的波动率是最近p个波动率和q个残差平方的的线性组合。GARCH的优点显而易见,一个高阶的ARCH模型可能有一个更为简洁和更易识别和估算的GARCH表达式,因为估计参数更加少了。
ARCH和GARCH模型的不足之处是类似的,两种模型认为波动是对称的,因为是对$\epsilon_t^2$建模;其次是参数需要满足的约束非常复杂;最后是拟合波动率的做法有投机取巧的嫌疑,要进一步理解波动率的动态还需要其他理论。